2章メモ 教師あり学習
クラス分類
目的は、クラスラベルを予測すること
2クラス/多クラス
回帰
目的は、連続値を予測すること
使った訓練セットと同じ性質を持つ、新しい未見のデータに対して正確な予想ができるようにしたい
汎化
過剰適合(overfitting、過学習)
訓練セットに対してはうまく機能するが、新しいデータに対しては汎化できない
過度に複雑なモデル
訓練セットに対する予測には興味がない
適合不足(underfitting)
訓練セットに対してすらうまく機能しない
単純すぎるモデル
過剰適合と適合不足の間に、最良の汎化性能
データセットが大きくなれば、より複雑なモデルを利用できる
データ量を増やす
あとで
np.bincount?